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Forum forum 


Noah Bubenhofer 

Drei Thesen zu Visualisierungspraktiken in den 
Digital Humanities 


In den Wissenschaften dienen Visualisierungen 
dazu, 1. eine Idee in eine grafische Form zu über¬ 
führen, um sie verständlicher zu machen, 2. statis¬ 
tische Ergebnisse zu präsentieren oder 3. Daten zu 
explorieren. In den Digital Humanities wird vor 
allem der dritten Funktion großes Potenzial zuge¬ 
schrieben: Mit visuellen Analysemethoden sollen 
große, komplexe und manchmal unstrukturierte 
Daten so hergerichtet werden, dass sie aus Distanz 
»gelesen« werden können (»Distant Reading«, vgl. 
Moretti 2009). So werden z. B. Zusammenhänge 
zwischen Akteuren oder anderen Entitäten als 
Netzwerk modelliert und visualisiert oder Infor¬ 
mationen mit geografischem Bezug kartiert. Diese 
Visualisierungen, auch »Diagramme« genannt, be¬ 
stehen im besten Fall aus folgenden grundsätzli¬ 
chen Arbeitsschritten: 

- Für Elemente in den Daten, die von Interesse 
sind, wird ein Set von grafischen Zeichen geschaf¬ 
fen, die in ikonischen Verhältnissen zum Gemein¬ 
ten stehen - zusammen mit Regeln für die Trans¬ 
formation der Elemente in die grafischen Zeichen 
(Beispiel: Knoten stehen für Akteure, Kanten ste¬ 
hen für Beziehungen). 

- Die Anwendung der definierten Regeln auf 
Daten führt zu einem Diagramm (Beispiel: Netz 
von Knoten und Kanten). Entscheidend für die 
Visualisierung digitaler Daten ist hier, dass diese 
Regeln programmiertechnisch als Algorithmus im¬ 
plementiert werden können. Damit können 
grundsätzlich beliebige, ähnlich strukturierte Da¬ 
ten, in jedem Umfang, visualisiert werden. 

- Nun kann mit dem Diagramm » operiert « wer¬ 
den, wobei im besten Fall neue Erkenntnisse über 
die Daten gewonnen werden, da das Diagramm 
Eigenschaften oder Zusammenhänge sichtbar 
macht, die vorher nicht sichtbar waren (Beispiel: 
Knoten im Netz, die besonders viele Verbindungen 
zu anderen Knoten aufweisen und deshalb als 
zentrale Knoten interpretiert werden können). 

Diese »diagrammatischen« Aspekte von Visuali¬ 
sierungen wurden und werden aus semiotischer 
Perspektive in ihrer ganzen Komplexität beleuch¬ 
tet (Peirce 1994; Krämer 2009; Bredekamp/ 
Schneider/Dünkel 2008 und viele mehr). Auf 
der anderen Seite werden die Herausforderungen 


der Konzeption, Implementierung und Evalua¬ 
tion von visuellen Analysesystemen vor allem in 
neuerer Zeit hauptsächlich unter dem Label »Vi¬ 
sual Analytics« behandelt (Chen/Härdle/Unwin 
2008; Keim u. a. 2010; Thomas/Cook 2005). Da¬ 
raus ergab sich in den letzten Jahren eine deutliche 
Professionalisierung in Form von wissenschaftli¬ 
chen Disziplinen, die sich diesen konzeptionellen 
und vor allem technisch herausfordernden Auf¬ 
gaben stellen. 

Für die digitalen Geisteswissenschaften ist das 
eigentlich eine erfreuliche Entwicklung: Es stehen 
Tools und Algorithmen zur Verfügung, um große 
Datenmengen bezüglich bestimmter Aspekte zu 
visualisieren und damit interpretierbar zu machen. 

Gleichzeitig wirft die Anwendung von visuellen 
Analysemethoden in den Geisteswissenschaften 
eine Reihe von kritischen Fragen auf, die kaum 
diskutiert werden und die ich in Form von drei - 
provokativen - Thesen antippen möchte: 

1. Visuelle Analysemethoden folgen utilitaristi¬ 
schen und positivistischen wissenschaftlichen 
Denkstilen, die nur bedingt mit den Geisteswissen¬ 
schaften kompatibel sind. 

2. Die Geisteswissenschaften unterschätzen die Be¬ 
deutung der programmiertechnischen und algo¬ 
rithmischen Grundlagen der verwendeten visuel¬ 
len Analysemethoden. 

3. Visuelle Analysetools für die Digital Humani¬ 
ties laufen Gefahr, traditionellen Interpretations¬ 
methoden nachzueifern statt die Chancen des da¬ 
tengeleiteten Paradigmas zu nutzen. 

Erstens: Mit »Illuminating the Path« gaben 
2005 Thomas und Cook die Forschungsagenda 
für »Visual Analytics« heraus, finanziert durch das 
US Department of Homeland Security - eine 
Reaktion auf die Terroranschläge 9/11 in den 
USA. Das Ziel: »the development of advanced 
information technologies to Support the homeland 
security mission« (ebd.: i). Visuelle Analysemetho¬ 
den sollen also dabei behilflich sein, im Datenwust 
der digitalen Welt Spuren zu finden, die auf 
kriminelle /terroristische Aktivitäten hindeuten: 
»identifying a plot or threat that is hinted at, but 
not clearly communicated, by a small subset of the 
documents in the collection« (Görg / Liu / Stasko 
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2014). Auch wenn in der Folge visuelle Analyse¬ 
methoden in völlig unterschiedlichen Gebieten 
eingesetzt worden sind, ist doch immer das Leit¬ 
motiv deutlich hörbar. Visual Analytics zielt auf die 
Entwicklung von »effective analysis tools« (Keim 
u.a. 2010: 2), »to turn information overload [...] 
into a useful asset« (Keim u. a. 2006), indem sie die 
Wahrheit in den Daten ans Licht holen. Systeme, 
die dieses Ziel verfolgen, können - und müssen in 
logischer Konsequenz - anschließend darauf hin 
evaluiert werden, wie gut sie dieses Ziel erfüllen. 
Dafür testet man die Methode anhand eines Test¬ 
datensatzes, in dem eine »ground truth« verborgen 
ist, die gefunden werden soll (Keim u. a. 2010: 139; 
Görg/Liu/Stasko 2014: 344). 

Trotz aller Vielfalt von Analyse- und Interpreta¬ 
tionsmethoden in den Geisteswissenschaften mu¬ 
tet dieses Verständnis von Datenanalyse grundsätz¬ 
lich etwas befremdlich an. Seien es Paradigmen 
wie Poststrukturalismus, Dekonstruktivismus, Dis¬ 
kursanalyse, Kulturanalyse, Gender Studies, Sys¬ 
temtheorie usw., in Daten, Quellen oder Arte¬ 
fakten wird normalerweise keine »ground truth« 
angenommen, die es bloß zu linden gilt. In der 
Linguistik werden beispielsweise Textkorpora und 
entsprechende Analysemethoden, darunter auch 
visuelle Analysemethoden, mit Gewinn benutzt, 
um Diskurse zu untersuchen und sprachliche 
Muster mit sozialem und kulturellem Handeln in 
Verbindung zu bringen (Bubenhofer 2009; 
Spitzmüller /Warnke 2011; Angermuller 2014; 
Felder /Müller /Vogel 2011; Scharloth / Eugs- 
ter/Bubenhofer 2013; Mautner 2012). Explora- 
tive, datengeleitete Methoden helfen dabei, in den 
Daten Zusammenhänge zu entdecken, die vor 
dem Hintergrund einer Theorie gedeutet werden. 
Die theoretische Basis, die Methodologie und de¬ 
ren Operationalisierung und Implementierung als 
Analyseinstrument bilden zusammen mit der For¬ 
scherin / dem Forscher und dem disziplinären Set- 
ting ein Gewebe, das die Deutung formt. Ob wir 
im Rauschen eine »wissenschaftliche Tatsache« 
(Ludwik Fleck) erkennen, hängt vom Denkkollek¬ 
tiv ab, in dem wir uns bewegen: »Alles Erkennen 
ist ein Prozeß zwischen dem Individuum, seinem 
Denkstil, der aus der Zugehörigkeit zu einer sozia¬ 
len Gruppe folgt, und dem Objekt« (Fleck 1983: 
168). Die Evaluationsmethoden, die innerhalb ei¬ 
ner wissenschaftlichen Disziplin entwickelt wer¬ 
den, dienen demnach genau dazu: zu entscheiden, 
ob innerhalb dieser Disziplin - und nur dieser 
Disziplin - ein Instrument in der Lage ist, im 


Rauschen der Daten das zu entdecken, was nach 
Ansicht des Denkkollektivs eine wissenschaftliche 
Tatsache ist. Die Instrumente der Visual Analytics 
werden - innerhalb der Geisteswissenschaften an¬ 
gewendet - dabei jedoch zu anderen Instrumen¬ 
ten, die den Regeln geisteswissenschaftlicher Denk¬ 
kollektive folgen. Ich zweifle, ob sie da, einem 
utilitaristischen Topos folgend (Geoffey 2014: 21; 
Böhme 2006: 55), effektive Analysetools sind, die 
den »Informationsüberfluss« zähmen können. 
Nach geisteswissenschaftlicher Logik sind sie viel¬ 
leicht eher dann »nützlich«, wenn sie reiche Nah¬ 
rung für die Deutung bieten, etwa im Sinne einer 
»Dichten Beschreibung« (Geertz 1987). 

Zweitens: Zur Verarbeitung und Analyse von 
digitalen Daten kommen Algorithmen, statistische 
Maße, Berechnungen etc. zur Anwendung. Hinter 
einer Netzwerkanalyse beispielsweise stecken eine 
Vielzahl von Schritten der Datenaufbereitung und 
ein Algorithmus, mit dem die Knoten und Kanten 
des Netzes definiert werden. Schließlich ist es ein 
weiterer Algorithmus, der das Netz visualisiert und 
dabei z. B. physikalische Kräfte in Form von 
Sprungfedern zwischen den Knoten simuliert, 
um die Knoten auf einer Fläche anzuordnen 
(Pfeffer 2010). 

Bei jedem der Schritte müssen Entscheidungen 
getroffen werden, die sich auf alle weiteren Schritte 
auswirken - und selbstverständlich auch auf die 
Interpretation der Daten. Es ist also gefährlich, 
solche Analyseinstrumente als Black Boxes zu nut¬ 
zen, als Nutzer oder Nutzerin also nicht Bescheid 
über die Funktionsweise des Instruments zu wis¬ 
sen. Dies ist im Fokus der Digital Humanities, 
wenn auch das Problem längst nicht gelöst ist, da 
damit die Anforderungen an die methodischen 
und theoretischen Kompetenzen der Forscherin/ 
des Forschers stark steigen (Berry 2012: 75; 
Rieder/Röhle 2012; Bubenhofer/Scharloth 
2015). 

Relativ wenig Gewicht wurde bislang aber der 
programmiertechnischen Implementierung dieser 
Algorithmen beigemessen: Macht es einen Unter¬ 
schied, ob der Algorithmus zur Netzdarstellung in 
der Programmiersprache C oder in Javascript um¬ 
gesetzt wird ? 

Ich möchte darauf aufmerksam machen, dass 
Programmieren eine zutiefst kulturell geprägte 
Tätigkeit ist (Coleman 2012; Manovich 2014; 
Ford 2015). Mit der Wahl einer Programmier¬ 
sprache und einer Programmierumgebung 
schreibt man sich in eine Programmierkultur ein, 
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die von bestimmten Idealen und Topoi geprägt 
ist. Deutlich wird das beispielsweise, wenn man 
sich den Wandel der Programmierkulturen be¬ 
trachtet, die etwa mit der OpenSource-Bewegung 
und kollaborativen Webplattformen (»Web 2.0«) 
einher geht. Im Bereich der Datenvisualisierung 
sind heute Javascript-Bibliotheken wie »D3« (Bos- 
tock/Ogievetsky/Heer 2011) prägend: Damit 
kann auf Basis von bereits bestehendem Code, 
der offen ist und im Web distribuiert wird, leicht 
eine neue Visualisierungsanwendung program¬ 
miert werden, die ohne komplizierte Anpassungen 
sofort auf jedem Rechner mit jedem Betriebssys¬ 
tem im Webbrowser funktioniert. Noch vor weni¬ 
gen Jahren war die Programmierung solcher Tools 
weit aufwändiger und führte zu Anwendungen, 
deren Code nicht (ohne weiteres) einsehbar war 
und die differenzierte Systemvoraussetzungen ver¬ 
langten, um ausgeführt werden zu können. Damit 
ist die technische Hürde, sich selber ein Analyse¬ 
tool zu programmieren, deutlich niedriger gewor¬ 
den, was ein gewichtiger Vorteil ist, um der Forde¬ 
rung nach White Boxes nachkommen zu können. 
Gleichzeitig ist aber auch klar, dass ein deutlicher 
Zusammenhang zwischen Programmierkulturen 
und darin entstehenden Programmen besteht, 
der sich auf die Analysearbeit mit diesen Program¬ 
men auswirkt, etwa indem ihnen dezentrale, un¬ 
koordinierte Remix-Arbeitsweisen inhärent sind 
(vgl. dazu auch Berry 2008). Es ist für die Digi- 
tal-Humanities-Forscherin relevant, ob sie mit ei¬ 
nem Tool arbeitet, das in C oder Javascript erstellt 
worden ist. 

Drittens: In den Visual Analytics gibt es ein 
»Mantra«, das ein »gutes« Werkzeug beschreibt: 
»Overview first, zoom and filter, then details-on- 
demand« (Shneiderman 1996). Die Visualisierung 
soll also sowohl den Überblick über die Daten als 
auch den Fokus auf das einzelne Datum erlauben. 
Bei der Arbeit mit Textdaten wird dies oft so 
interpretiert, dass mit dem Analyseinstrument 
letztlich jederzeit auf das einzelne Textdokument 
zugegriffen werden können muss. 

Diese Forderung scheint auf den ersten Blick 
plausibel und hat gewiss auch ihre Berechtigung. 
Nur besteht die Gefahr, dabei gerade den Vorteil 
quantitativer, datengeleiteter Analysen von Daten 
aus dem Blick zu verlieren. Franco Moretti forderte 
aus literaturwissenschaftlicher Sicht: »what we re- 
ally need is a little pact with the devil: we know 
how to read texts, now let’s learn how not to read 
them« (Moretti 2000: 57). Die Digital Humani- 


ties, genauer vielleicht die maschinellen Textanaly¬ 
semethoden, bringen den Vorteil, die Einheit des 
Textes aufzubrechen (Bubenhofer 2009:105). Ziel 
ist es, durch eine Aufbereitung des Textkorpus, ggf. 
durch eine Visualisierung bestimmter Strukturen, 
ein emergentes Phänomen sichtbar zu machen. 
Ein Phänomen, das sich also nicht aus der Summe 
der Einzelbeobachtungen erklären lässt, sondern 
mehr als das ist. Ein mit statistischen Methoden 
erstelltes Kollokationsprofil eines Wortes ist ein 
solches Phänomen: Es fasst das statistisch über¬ 
zufällige Kovorkommen von Wörtern in großen 
Textkorpora so zusammen, dass daraus ein Bild 
entsteht, wie das Wort in den Daten normaler¬ 
weise verwendet wird (Evert 2009). In weiteren 
Abstraktionsschritten können die Kollokations¬ 
profile maschinell nach Ähnlichkeit gruppiert wer¬ 
den, um semantische Felder (Keibel/Belica 2007) 
zu berechnen oder Lexempaare zu finden, die in 
gleichen semantischen Relationen zueinander ste¬ 
hen (etwa nach Mikolov u.a. 2013). Der Einzel¬ 
beleg ist dabei unbedeutend - er kann dem emer- 
genten Profil sogar widersprechen. Interessant ist 
die zusammenfassende Darstellung, die genug un¬ 
genau ist, um das Wesentliche vom Unwesentli¬ 
chen zu trennen. 

Wenn der Forscher oder die Forscherin bei der 
Analyse der Daten doch meint, ein Blick in die 
Einzeltexte sei notwendig, um die quantitativ auf¬ 
bereiteten Daten deuten zu können, dann ist die 
quantitative Aufbereitung noch keine genügend 
gute Operationalisierung des zu untersuchenden 
Phänomens. Es mag z. B. sein, dass sich im Kollo¬ 
kationsprofil Daten finden, die wir nicht als gene¬ 
rellen Aspekt der Semantik des entsprechenden 
Wortes akzeptieren würden - beispielsweise weil 
sie auf einen häufig genannten Buch- oder Film¬ 
titel in den Daten zurück gehen, was sichtbar wird, 
wenn man sich die Einzelbelege ansieht. Dies 
bedeutet jedoch, dass die Operationalisierung von 
Semantik eines Wortes mittels Kollokationsprofi¬ 
len noch nicht ideal ist, sei es, dass die Berechnung 
noch zu wenig gut modelliert ist oder aber, dass die 
Daten zu wenig ausgewogen oder umfangreich 
sind. Wenn diese Probleme jedoch gelöst sind, 
müsste der Blick in die Einzelbelege nicht mehr 
notwendig sein. 

Wenn trotz dieser Überlegungen der Wunsch 
bleibt, immer wieder einen Blick in die Details zu 
werfen, verbirgt sich dahinter vielleicht ein wissen¬ 
schaftlicher Gestus, der nach wie vor dem Einzel¬ 
text huldigt und in der quantitativen Datenanalyse 
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ein Mittel sieht, diese Aufgabe, das Lesen von 
Einzeltexten, schneller erledigen zu können. Dies 
können quantitative Methoden generell und vi¬ 
suelle Analysemethoden im Besonderen nicht leis¬ 


ten. Diese Methoden ermöglichen neue Fragestel¬ 
lungen, nicht Lösungen für die alten Fragen. 
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